咬文嚼字之mapping&alignment

您所在的位置:网站首页 on overage是什么意思 咬文嚼字之mapping&alignment

咬文嚼字之mapping&alignment

2023-08-11 05:06| 来源: 网络整理| 查看: 265

写在前面的废话

有时候我在读文献时,明明前面用的是alignment,但是接下来又使用了mapping。起初,我认为二者意思相同,后来发现没那么简单。无奈之下只能自己搜集资料思考二者的区别……

心情复杂 太长不看系列 alignment:讲究细节,需要知道比对的具体情况 mapping:只看整体,不关注比对的具体情况 废话超多系列 alignment vs. mapping alignment与mapping之间的区别

当我们要比对(align)一个read时,我们不仅要知道它在基因组中可能出现的位置,而且还要知道对应位置的确切碱基。举一个例子,一个read seq1很有可能来源于1号染色体,其坐标位置从123到140。seq1read中的前7个碱基与参考基因组精确比对上,接着有3个碱基的插入,接着剩余的碱基read seq1和参考基因组比对上。

上面的例子中,我们知道这个reads比对的具体信息(具体位置,是否错配,有无indel等),此时我们对这种比对情况称之为alignment。

而当我们匹配(mapping)一个read时,我们仅仅需要知道read它来自哪里,而不关心read和reference之间的确切比对。

比如科研工作者的脱发现象。当我说我秃了,你不用关心我掉了多少头发,还剩多少头发,你只需要知道我秃了这一情况就可以了

挺秃然的

早先,比对(alignment)和匹配(mapping)经常会被误用。但是像Kallisto和Salmon之类的工具改变了这一情况,因为他们将reads assign到基因、功能以及其他的什么东西上,而不需要知道其中确切的比对信息。这样做的方式有两个优点:

更快 我们通常不关心比对,这在一些应用/工具中是一个很大的优势

Kallisto:一个用于single cell & bulk RNA-seq数据的转录本定量工具 Salmon:与Kallisto类似的一个工具

不同种类的alignment

既然讲到了alignment,那我们就继续看看alignment带上不同的形容词,都有什么不同的含义。

pairwise alignment:两个序列之间的比对 Multiple sequence alignment:两个及以上序列之间的比对 Short read aligners:就是寻常说的pairwise alignment quality vs. mapping quality

我们都知道比对之后,会有比对的质量,那么mapping和alignment的质量有什么不同呢?作为一个认真努力的科研工作者,那我必须深挖一下这个问题。

image.png alignment quality:是指reads比对到参考基因组上的匹配质量 mapping quality:是reads正确匹配到基因组位置的置信度(可能性)

比如,将一个read比对到基因组上,这个read在该基因组上的若干个位置都有很完美的比对。此时alignment quality是很高的,而mapping quality是比较低的。

depth vs. coverage

既然都讲到了比对,那么测序深度和覆盖度就不得不提一下了。

depth(测序深度):通常是指整个基因组。(测序的reads数 * reads 的长度)/单倍体基因组的长度 coverage(覆盖度):通常是指某个具体位点的深度。比如:测序过程中,某一个区域(比如,某个基因,某一个碱基位置等)所覆盖的reads数

coverage取决于具体的比对算法。比如:有的算法会在这里刚好匹配,有的认为在这里存在错配,有的则插入一个gap……

正如上面所述,二者应该是有区别的。但是大部分文献都会将其混用,如果没有前后文的对照,你很有可能会误解作者的意思。

那么该怎么办呢?怎么办呢?通常有三个方法:

利用前后文语境,猜测此处的含义 看到coverage首先把它当作覆盖度,看到depth首先把它当作测序深度

此外,需要注意的一点是,depth/coverage经常会和其他词语联合使用,这个时候就需要靠经验总结了。我知道你们肯定懒得总结,所以我在这里给出了自己总结的的一些小tips

breadth of coverage(覆盖范围):在给定测序深度的情况下,基因组碱基得覆盖百分比 Depth of coverage:等同于coverage Sequence depth:等同于depth image.png Reference Sequencing depth and coverage: key considerations in genomic analyses https://www.biostars.org/p/6571/ https://bitesizebio.com/34461/ngs-depth-coverage-deep-sequencing/


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3